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La problématique de la surcharge informationnelle 


n’est point de l’ordre du « Big Data » , mais une + La limite de ces approches de type 


question de « Bad Data » « arithmétique » demeure dans le fait que les 


dimensions sémantiques voire cognitives ne sont 
+ Réciproquement, exclure du « Bad Data » pas valorisées. 


consiste à extraire du « Good Data ». : 
° Illustration : 


+ Le « Good Data » est beaucoup plus que de la . . | | 
Nous pouvons extraire de la connaissance à partir 


donnée, plus que de l'information ; c’est de la , . _: 
RARE os d’une unité lexicale minimale : Un (1) mot. 


connaissance. 


+ La Connaissance est une information efficiente, Résumé Extraction de 


. : . . | de texte connaissances 
orientée vers un sujet et qui permet la prise de 


décision. 
, ; | È 1 Phrase Difficile 
+ L’extraction de connaissances, en raison du 
caractère non absolu que revêt pareille démarche, (once 


ne peut consister en une recherche d’optimum. 


” Exemple : À partir du mot Conscience, ayant 


; : . | : ; 
e L'’extraction de connaissances à partir d’un 36 synonymes : nous avons identifié les mots 


corpus de texte en language naturel est donc une advertance, esprit, minutie, moralité, comme 


recherche de Satisfactum. ayant une plus haute contribution à la 


+ Le procédé extractif en question diffère du connaissance du Concept induit par le mot 


résumé de texte. Conscience. 


+ Le résumé automatisé de texte (principalement %X La hiérarchisation sémantique par critère 


_— _ 7. 
extractif) s'effectue sur des critères statistiques de validité informative permet d’envisager 


relatifs à la distribution des mots, leurs positions ie iomoaibon dé lésion: dé 


ns l r : r modè : . : 
dans le corpus ; ou se base sur des modèles de connaissances, à partir d’un corpus de texte en 


type probabiliste. language naturel. 


